大连理工大学建筑与艺术学院,大连 116023
摘 要:铁路作为现代交通基础设施的核心,其发展历程不仅体现各国交通建设水平,也反映经济、社会及地缘格局的深刻演变。针对全球铁路运营里程历史数据存在缺失,以及部分历史数据因国界变动无法对应现有国界的问题,本文整合了Brian
Mitchell编撰的International
Historical Statistics、世界银行、国际铁路联盟及各国统计局数据,构建了1825–2021年全球铁路运营里程数据集。研究首先对全球铁路运营里程历史数据中的缺失进行了分类识别,并将其划分为3类:时间序列中段缺失、末端缺失,以及因国别边界调整导致的数据缺失。针对不同类型的缺失,分别采用线性插值、回归预测及静态/动态权重拆分方法对数据进行了补全。基于完善的数据集,研究进一步从区域和国家两个层面对全球铁路发展进行了时空演化分析。结果显示:(1)全球铁路发展可划分为5个阶段,呈现明显的阶段性和波动特征;(2)区域差异显著,欧美国家在早期占据主导地位,而亚洲国家在21世纪成为新的增长引擎;(3)全球铁路发展深受地缘政治与地缘经济因素影响,不同历史时期的互动格局决定了全球铁路演化轨迹。本研究不仅为全球基础设施历史演化提供系统性数据支撑,也为探索交通与经济社会互动机制奠定了坚实基础。
关键词:全球;铁路运营里程;阶段划分;演变轨迹;区域分化
DOI: https://doi.org/10.3974/geodp.2025.03.03
CSTR: https://cstr.escience.org.cn/CSTR:20146.14.2025.03.03
数据可用性声明:
本文关联实体数据集已在《全球变化数据仓储电子杂志(中英文)》出版,可获取:
https://doi.org/10.3974/geodb.2025.08.07.V1或https://cstr.escience.org.cn/CSTR:20146.11.2025.08.07.V1.
铁路作为现代交通运输体系的核心组成部分,在国家经济社会发展中发挥着重要作用。自19世纪现代铁路技术问世以来,铁路网络迅速扩张,并在全球范围内形成了高度互联的运输体系。它通过提升可达性、降低运输成本、强化关键节点城市与区域联系,在城市系统、区域发展、国家空间组织乃至全球交通网络等多个层面,对社会、经济及空间格局产生了深远影响。铁路运营里程是衡量铁路运输发展水平的重要指标,能够直观反映一个国家或地区铁路基础设施的建设规模与服务能力。对其变化趋势的分析,不仅有助于揭示全球交通基础设施发展的总体格局与演化路径,还可以通过跨国比较,深入理解经济发展阶段、地理条件和制度环境等因素对铁路建设的影响。此外,这一分析还可反映全球基础设施投资重心的转移趋势,并揭示区域发展不平衡的问题。因而,系统探讨铁路运营里程的时空演变及其驱动机制,对于深化交通基础设施与经济社会发展之间互动关系的认识,具有重要的理论价值与现实意义。
然而,在全球范围内整合铁路运营里程的历史数据仍面临诸多挑战。首先,战争、经济动荡以及技术条件的限制,常常导致部分历史时期的数据缺失,破坏了时间序列的连续性。其次,剧烈的地缘政治变迁(如苏联、奥匈帝国等多民族国家的解体)使得历史数据难以精确映射至当前国家边界,进一步增加了数据整合的复杂性。这些问题在一定程度上限制了对铁路发展进行长时段、跨区域的系统性比较研究。因此,构建统一且具可比性的历史数据框架,已成为推动全球铁路发展研究的重要基础工作。
为了解决上述问题,本研究系统整合了1825–2021年全球铁路运营里程数据(涵盖普速铁路数据,高速铁路数据未纳入)。本研究所使用的数据主要来源于Brian Mitchell编撰的International Historical
Statistics (1750–2010)[1],而2010年以后的数据则来源于世界银行、国际铁路联盟(International Union of Railways,UIC)及各国统计局发布的官方记录。数据集覆盖了全球五大洲共计133个国家和地区。
《全球铁路运营里程数据集(1825–2021)》[2]的名称、作者、地理区域、数据年代、时间分辨率、数据格式、数据集组成等信息见表1。
3.1 数据来源
本数据集的数据主要来源于International
Historical Statistics (1750–2010)[1]、世界银行[4]以及各国统计局的公开记录,涵盖了1825年至2021年间各国年度铁路运营里程数据。鉴于部分国家尚未建设铁路基础设施,或因历史资料缺失及数据公开性不足,相关数据难以获取,最终数据集涵盖了全球共133个国家和地区,占比约56.7%。这些国家和地区分布于五大洲,包括美洲29个、欧洲36个、亚洲30个、非洲36个以及大洋洲2个。
3.2 缺失数据处理
本数据集涵盖了1825至2021年期间,涉及五大洲的133个国家和地区。由于历史档案不完整,约有17.07%的数据存在缺失。数据缺失情况包括:(1)时间序列中间缺失,即某国某一年或连续若干年数据缺值,但前后年份数据完整;(2)时间序列末端缺失,即数据缺失集中于时间序列尾部,需进行趋势外推;(3)国别边界调整导致的数据缺失,即国界发生变化时,需依据现有国界,并结合历史数据对相关指标进行重新拆分与分配。为提升数据的完整性与可用性,本文针对上述3类情况,分别采用线性插值、线性回归预测与静态/动态权重拆分方法进行补全,并进行了相应的调整与优化。
表1 《全球铁路运营里程数据集(1825–2021)》元数据简表
|
条
目 |
描
述 |
|
数据集名称 |
全球铁路运营里程数据集(1825–2021) |
|
数据集短名 |
Railway1825-2021 |
|
作者信息 |
李永玲,大连理工大学建筑与艺术学院,yongling1004@hotmail.com 于雍浩,大连理工大学建筑与艺术学院,937952896@qq.com 蔡军,大连理工大学建筑与艺术学院,caimans@dlut.edu.cn |
|
地理区域 |
全球五大洲133个国家/地区(90 °N –60 °S) |
|
数据年代 |
1825–2021年 |
|
时间分辨率 |
年 |
|
数据格式 |
.xlsx |
|
数据量 |
1.43 MB |
|
数据集组成 |
铁路运营里程;铁路运营里程增长率 |
|
基金项目 |
国家自然科学基金(42201186,42371177) |
|
出版与共享服务平台 |
全球变化科学研究数据出版系统 http://www.geodoi.ac.cn |
|
地址 |
北京市朝阳区大屯路甲11号100101,中国科学院地理科学与资源研究所 |
|
数据共享政策 |
(1)“数据”以最便利的方式通过互联网系统免费向全社会开放,用户免费浏览、免费下载;(2)最终用户使用“数据”需要按照引用格式在参考文献或适当的位置标注数据来源;(3)增值服务用户或以任何形式散发和传播(包括通过计算机服务器)“数据”的用户需要与《全球变化数据学报(中英文)》编辑部签署书面协议,获得许可;(4)摘取“数据”中的部分记录创作新数据的作者需要遵循10%引用原则,即从本数据集中摘取的数据记录少于新数据集总记录量的10%,同时需要对摘取的数据记录标注数据来源[3] |
|
数据和论文检索系统 |
DOI,CSTR,Crossref,DCI,CSCD,CNKI,SciEngine,WDS,GEOSS,PubScholar,CKRSC |
3.2.1 时间序列中间数据缺失的处理
针对某一国家铁路运营里程数据在时间序列中出现中间数据缺失的情况,即某一年或连续若干年份缺失,本文采用线性插值法进行补全。线性插值基于缺失区间相邻年份的已知数据,假设铁路运营里程在该区间内随时间呈线性变化趋势。相比更复杂的插值或拟合方法,线性插值无需额外参数假设,能够在确保数据连续性的同时,保持计算过程的简洁性和结果的可解释性。该方法适用于铁路发展相对平稳、缺失区间前后数值差异不显著的情形,能够有效避免因过拟合或参数不当引发的偏差问题。具体计算公式如下:
(1)
式中,
为待估年份t的铁路运营里程(km);前后两个相邻的已知年份分别为
和
(年),
和
分别为对应年份的铁路运营里程(km)。在整个插值区间内,每一缺失年份均可通过该公式递推得到相应估计值。该方法不仅在数值稳定性与逻辑一致性方面具备良好性能,也在历史数据资料不完全、缺失连续性强的情形下保持了数据重建的可控性与透明性,因而被广泛应用于历史统计序列的修复处理。
3.2.2 时间序列末端数据缺失的预测
对于出现在时间序列末端的缺失数据,即需对未来年份铁路运营里程进行外推估计的情形,本文采用线性回归法对近年数据进行拟合,以构建预测模型。在多数国家,铁路运营里程的近期变化趋势较为平稳:发达国家的铁路系统已基本定型,而发展中国家的发展则受到政策与资金等因素的制约,年际变化通常较为缓慢。因此,线性回归在短期预测中具备良好的适用性与解释力。
具体而言,本文基于缺失年份前连续五年的观测值,通过最小二乘法对线性回归模型进行拟合,提取趋势的斜率并据此进行外推。线性回归模型参数a(截距)、b(斜率)通过以下公式估计:
(2)
(3)
式中,
和
分别为年份和对应的铁路里程(km),n为参与拟合的年份数量(此处为5年)。据此,可对未来第k年的值进行预测:
(4)
式中,k表示预测的年份跨度(例如,预测1年后,则k=1)。
3.2.3 边界重构国家的数据拆分与分配
由于历史上国家边界的多次变化,铁路运营里程的国别归属面临显著挑战。政治实体的分解、合并及反复调整,导致不少历史数据是按当时的整体政权统计的,无法直接对应现今的国别体系。这种空间单元的不一致,影响了铁路数据的时间连续性和跨国可比性。针对这一问题,本文根据历史数据结构的不同,将国别拆分情形划分为两类:
一是铁路里程早期仅有整体政权数据,现代国别统计则始于国家分解或边界稳定之后。针对该类情形,本文采用静态权重回溯法,依据边界稳定后各国在区域总里程中的占比,将整体数据追溯分解至各国,以估算其历史铁路运营里程。
二是特定时期仅有整体数据,但前后各国均有独立统计,多见于国家合并与分解的交替进行。针对这类情形,本文采用动态权重插值法,根据前后时间节点的国别占比进行逐年线性插值,将整体数据分解至各国,以更准确地刻画铁路发展的结构变化。
(1)静态权重回溯法
对于那些在历史时期缺乏单独国别铁路数据、仅在解体或边界划定后才出现现代国别统计的地区,本文采用静态权重回溯法进行拆分。具体做法是:首先获取边界稳定后各国的铁路运营里程数据,计算各国在区域总里程中的占比;然后,将这一比例作为权重,回溯分配历史时期的整体统计数据,从而估算各国在历史总量中的贡献份额。
以苏联为例,本文选取解体后10年(1992–2001年)各加盟共和国铁路运营里程的年均值,计算其在区域总里程中的权重,并据此将苏联时期的整体数据拆分到各国。该方法通过构建稳定期的平均权重,有效平滑了短期数据波动;同时,结合铁路网络的路径依赖特性,保证了历史数据拆分与现实空间格局的合理一致,进而实现各国历史铁路数据的回溯估算。
具体而言,假设变更前某年度t的总铁路运营里程(km)为
,现今国家单元j在边界调整完成后10年内的铁路运营里程均值为
,则其对应的分配权重为:
(5)
式中,J为所有新形成的国家单元集合。据此,可推算出国家j在历史年份t的估算铁路运营里程为:
(6)
(2)动态权重插值法
对于部分地区,虽然历史时期铁路数据以区域整体统计、缺乏国别分项,但在该时期前后,均可获得各国独立铁路运营数据。针对这种情况,本文提出动态权重插值法,通过前后两个时间节点的铁路里程占比,构建逐年平滑变化的权重序列,实现历史数据的国别拆分。
以乌干达、肯尼亚和坦桑尼亚为例,1948–1974年期间,三国铁路系统由英属东非铁路局统一运营,相关数据仅以整体形式记录,缺乏国别统计。然而,1947年(统一管理前)和1975年(各国独立运营后),三国均有各自的铁路运营数据。本文基于这两个时间点的里程占比,假设各国在统一管理期内的铁路份额按线性趋势逐步变化,逐年生成动态权重,并据此将整体数据拆分至国别。该方法既保持了区域总量的一致性,又反映了铁路体系结构的演变过程,使拆分结果更符合实际发展趋势。
具体而言,设某年份t的区域总铁路运营里程为
,需将其拆分至n个国家单元。假设在拆分前的年份
和拆分后的年份
均有国别独立数据,可计算两个时间点的权重,分别为:
(7)
式中,
表示国家i在年份t的铁路运营里程(km),j=1,2,……, n为参与分配的所有国家编号,
为国家i在区域总量中的占比(%)。
在此基础上,构建时间段[
,
]内各年份t
,
的线性变化权重函数:
(8)
再将该年份的合并总值
按权重进行分配,得到国家i的预测值:
(9)
动态权重插值法适用于历史统计中缺乏中间国别数据,但在前后时期具备可比独立数据的国家组合。该方法特别适合铁路发展较为平稳、各国占比演变规律明确的地区。相比静态权重回溯法,动态插值法更能反映国别占比随时间的变化过程,提升历史数据拆分的时间敏感性和准确度。
4.1 数据集组成
《全球铁路运营里程数据集(1825–2021)》以.xlsx格式存储,数据量为1.43 MB,共计27,186条数据,包含国家名称、所属大洲、年份、铁路运营长度、铁路运营增长率以及数据来源等内容。
4.2 数据结果
4.2.1 区域尺度
图1揭示了1825至2021年间全球五大洲铁路运营里程的演变轨迹。根据发展特征与重大历史事件,全球铁路网络演进可明确划分为5个具有鲜明特征的阶段,各阶段均展现出显著的区域分化。第一阶段(1825–1870年)是铁路技术的萌芽与扩散期,在工业革命浪潮和殖民扩张需求的双重驱动下,铁路作为工业化进程的核心运输载体在欧洲和北美率先兴起,两大陆铁路建设呈现同步快速增长的态势。第二阶段(1870–1913年)标志着全球铁路建设的黄金时代,美洲大陆的铁路网络呈现爆发式扩张,欧洲保持稳定增长,而亚洲、非洲和大洋洲也相继开启铁路建设热潮,推动全球铁路里程进入前所未有的高速增长阶段。第三阶段(1913–1945年)受两次世界大战和1929年大萧条的严重影响,全球铁路发展陷入低谷,美国铁路公司大规模破产导致美洲铁路里程显著萎缩,亚洲、非洲和大洋洲同样出现不同程度的衰退,战争破坏与经济萧条共同制约了铁路网络的扩展。第四阶段(1945–2000年)呈现出明显的区域分化特征,除亚洲在政府主导的基础设施建设推动下保持扩张势头外,其他大洲的铁路运营里程普遍呈现下降趋势。进入第五阶段(2000–2021年),全球铁路发展迎来新一轮增长周期,其中亚洲成为最主要的增长引擎,该地区铁路运营里程实现24.8%的显著增长,在全球总量中的占比达到26.5%,这一增长主要得益于中国通过大规模新建线路和既有线改造实现的铁路网络升级。

图1 五大洲铁路运营里程发展趋势图
4.2.2 国家尺度
从国家尺度分析,图2至图6清晰呈现了各洲主要国家铁路发展的典型特征。在欧洲(图2),英国作为铁路革命的先驱,1825年建成世界首条铁路后迅速构建起全国性网络,其技术标准、管理制度和建设经验对全球铁路发展产生深远影响,至一战前运营里程已达30,000 km。俄罗斯则展现出大陆型国家的铁路发展模式,19世纪末西伯利亚大铁路等干线建设使其形成全球最长的铁路网络之一,苏联时期更将铁路扩展至80,000 km以上,成为支撑国土开发和经济计划的核心基础设施。西欧和中欧地区呈现出差异化发展路径:德国在统一后通过铁路国有化加速网络整合,推动重工业崛起与国家统一市场形成;法国则坚持国家主导的集中式规划,构建以巴黎为中心的放射状网络体系。值得注意的是,比利时虽国土狭小,却凭借早期铁路建设与高密度网络长期保持欧洲领先地位。两次世界大战对欧洲铁路造成普遍破坏,战后更面临公路运输的激烈竞争,导致多数国家运营里程持续缩减,这一趋势直到高铁时代才得以扭转。各国铁路发展历程既反映了技术演进的内在逻辑,也深刻体现了国家治理模式与地缘政治格局的互动关系。

图2 欧洲典型国家铁路运营里程发展趋势图
在美洲地区(图3),铁路发展呈现出鲜明的区域特征。美国作为全球铁路发展的标杆,其铁路网络在20世纪初期达到顶峰,运营里程突破400,000 km,创下世界纪录。这一辉煌成就得益于19世纪后半叶的快速扩张期,当时铁路被视为连接东西海岸、促进西部开发的关键基础设施。然而,1929年经济大萧条成为重要转折点,随着公路和航空运输的崛起,铁路在运输体系中的主导地位逐渐削弱,导致运营里程持续缩减[5]。加拿大作为北美第二大铁路国家,其发展轨迹与美国既有相似之处又具独特性。贯穿20世纪大部分时间,加拿大铁路网络保持稳定增长,这一态势直至1983年加拿大国家铁路公司实施线路优化调整后才发生转变。拉丁美洲的铁路发展则展现出不同模式,巴西、墨西哥和阿根廷等主要国家的铁路网络受制于经济发展水平、产业政策调整和地理条件等因素,整体呈现渐进式发展特征,运营里程长期维持在相对稳定的区间波动。这种发展差异不仅反映了各国工业化进程的独特路径,也深刻体现了交通运输方式变革对基础设施发展的深远影响。
在亚洲地区(图4),铁路发展呈现出鲜明的殖民遗产与现代转型双重特征。作为英国殖民体系的产物,印度铁路在19世纪中叶率先起步,至1947年独立前夕已建成超过60,000 km的庞大网络,这一殖民遗产使其长期保持亚洲铁路里程第一的地位。日本则在明治维新时期(1868–1912)通过技术引进与制度创新,将铁路建设纳入国家现代化战略[6],

图3 美洲典型国家铁路运营里程发展趋势图

图4 亚洲典型国家铁路运营里程发展趋势图
至二战前形成兼具军事与经济功能的铁路体系,其运营效率和技术水平位居亚洲前列。中国铁路发展经历了独特的演进轨迹:晚清至民国时期受制于列强控制与战乱影响发展滞缓,1949年后逐步实现自主建设,改革开放后进入加速发展期。特别是2008年以来实施的高铁战略推动中国铁路实现跨越式发展,“四纵四横”高铁骨干网的建成使中国在短短十余年间跃居全球高铁里程首位[7]。这种发展态势不仅重塑了亚洲铁路格局,更标志着全球铁路发展重心由欧美向东亚的历史性转移。三国迥异的铁路发展路径,深刻反映了殖民历史、国家能力与发展战略对基础设施建设的复合影响。
在非洲大陆(图5),铁路发展呈现出深刻的殖民烙印与不均衡特征。作为殖民运输体系的典型代表,非洲铁路网络自19世纪中后期开始建设,其布局完全服务于欧洲列强的资源进口需求——南非铁路以金矿和钻石运输为导向,刚果铁路专注于铜矿和橡胶出口,东非铁路则成为英国“开普敦–开罗”殖民计划的组成部分[8]。这种畸形发展导致非洲铁路呈现“三高三低”特征:资源输出线路密度高而内陆连接度低,沿海港口通达性高而区域互联性低,单线运输能力高而路网覆盖度低。南非作为特例,依托丰富的矿产资源和发展相对成熟的工业基础,其铁路网络在20世纪中叶突破20,000 km。而埃及、阿尔及利亚等北非国家虽起步较早,但受制于殖民经济结构,铁路发展长期停滞。刚果民主共和国等中非国家更因独立后的政治动荡,导致铁路系统严重衰退,部分殖民时期建设的线路甚至完全荒废。

图5 非洲典型国家铁路运营里程发展趋势图
在大洋洲地区,铁路发展呈现出显著的国别差异(图6)。澳大利亚作为该区域铁路发展的主导者,其铁路网络建设始于19世纪中叶,在联邦成立(1901年)前后迎来建设高潮,20世纪20年代运营里程峰值突破45,000 km。20世纪中后期,受公路运输竞争和财政紧缩影响,部分支线铁路被废弃,但主要干线仍保持运营。值得注意的是,21世纪以来,随着矿业繁荣和城市轨道交通发展,部分区域性铁路获得新生。相比之下,新西兰铁路发展呈现出“小而稳”的特点,其网络规模在20世纪50年代达到5,700 km峰值后缓慢收缩至当前约4,000 km。

图6 大洋洲典型国家铁路运营里程发展趋势图
4.3 数据结果验证
为评估补充数据的准确性,本数据集采用留出法进行验证:从原始数据中随机抽取20%的已知数据,视为伪缺失值,采用上述方法补全后与原始值对比,以平均绝对百分比误差(MAPE)作为评估指标,计算公式为:
(10)
式中,n为伪缺失点;
为真实运营里程值(km);
为伪缺失点的运营里程预测值(km)。
结果显示,各个国家的相关数据平均绝对百分比误差均在10%以内,表明补全方法具有较高的准确性(图7)。

图7 部分国家数据预测误差图
本研究系统整理并构建了1825–2021年全球铁路运营里程的长期数据集,针对历史数据缺失问题,采用多种方法进行补全与校验,从而为全球基础设施发展研究提供了系统而可靠的数据支撑。基于这些数据的分析表明,铁路不仅是重要的交通工具,更是观察各国现代化进程的重要窗口,其发展历程深刻映射了世界经济与政治格局的演变。
全球铁路运营里程的历史演变呈现出3个显著特征:首先,铁路发展具有明显的阶段性,19世纪在工业革命推动下快速增长,20世纪中期受战争和新兴交通方式冲击而放缓,21世纪又随着新兴经济体崛起而复苏。其次,区域发展差异显著,欧美等核心国家早期占据主导地位,而亚洲等边缘国家在后期实现快速追赶。最后,全球铁路发展深受地缘政治与地缘经济因素影响,不同历史时期的互动格局塑造了铁路演化的轨迹。例如,国际分工和殖民扩张推动了拉美、非洲和南亚地区的铁路建设。
尽管本研究在铁路运营里程数据的系统整理和缺失补全方面取得了较为明显的进展,但仍存在若干局限。一方面,受制于历史统计体系的差异,部分国家在早期年份的数据仍存在缺失或口径不一致的问题。另一方面,在边界重构国家的数据拆分中,静态与动态权重方法主要基于线性假设,难以充分捕捉实际历史过程中的非线性演化。此外,部分补全方法在极端年份样本有限的情况下仍面临适应性不足。未来研究可进一步引入机器学习与多源数据融合方法,深化铁路里程增长与经济社会变量的联动分析,进而推动跨尺度、跨学科的基础设施演化研究体系构建。
作者分工:李永玲负责数据收集和论文撰写;于雍浩负责数据处理与可视化;蔡军提出研究思路。所有作者均参与了研究思路的提出、内容审查与修改,以及统计分析的指导。
利益冲突声明:本研究不存在研究者以及与公开研究成果有关的利益冲突。
[1]
Mitchell,
B. R. International Historical Statistics, 1750–2010 [M]. London: Palgrave
Macmillan, 2013. DOI: 10.1057/9781137305688.
[2]
李永玲, 于雍浩, 蔡军. 全球铁路运营里程数据集(1825–2021)[J/DB/OL]. 全球变化数据仓储电子杂志, 2025.
https://doi.org/10.3974/geodb.2025.08.07.V1. https://cstr.escience.org.cn/CSTR:20146.11.2025.08.07.V1.
[3]
全球变化科学研究数据出版系统. 全球变化科学研究数据共享政策[OL]. https://doi.org/10.3974/
dp.policy.2014.05 (2017年更新).
[4]
World
Bank. Rail lines (total route-km) [DB/OL].
https://data.worldbank.org/indicator/IS.RRS.TOTL.KM.
[5]
Cohen,
J. Private capital, public credit and the decline of American railways,
1840–1940 [J/OL]. Journal of Transport History, 2010, 31(1): 42–68. DOI:
10.7227/TJTH.31.1.4.
[6]
Satya,
L. D. British Imperial Railway in Nineteenth Century South Asia [M]//Nayak, G. The
Railways in Colonial South Asia. London: Routledge, 2021: 85–113.
[7]
李长进. 新中国铁路发展的伟大成就与未来展望[J]. 国资报告, 2019(6): 26–29.
[8]
Scott,
M. A. Transcontinentalism: technology, geopolitics, and the Baghdad and
Cape-Cairo railway projects, c.1880–1930 [D]. Newcastle: Newcastle University,
2018.